17 research outputs found

    Writer identification and verification in handwritten documents

    Get PDF
    In this communication we apply an Information Retrieval model for the writer identification task. Queries are handwreitten document images projected on a suitable feature set. The handwritten document database is indexed according to the vector space model originaly used for textual information. The approach uses both the image and textual description of handwritten documents. Identified documents are then processed by the verification stage. We use a mutual information criterion so as to verify that each identified document can have been written by the writer of the query. Decision operates using an hypothesis test. The approcah is evaluated on two different database and proves to be robust to the variability of handwriting. Perspectives are oriented towards the use of large handwritten document databaseDans cette communication, nous appliquons un modĂšle de recherche d’information pour la tĂąche d’identification du scripteur. Les requĂȘtes sont des images de documents qui sont tout d’abord projetĂ©es dans un espace de caractĂ©ristiques. La base de documents manuscrits est indexĂ©e selon le principe du modĂšle vectoriel de recherche d’information textuelle. L’approche exploite donc Ă  la fois la reprĂ©sentation mixte image et textuelle spĂ©cifique d’un document manuscrit. Les documents identifiĂ©s Ă  l’issue de cette Ă©tape font ensuite l’objet d’une analyse complĂ©mentaire pour vĂ©rifier les hypothĂšses Ă©mises. Nous proposons d’utiliser un critĂšre d’information mutuelle pour vĂ©rifier que chacun des documents identifiĂ©s peut avoir Ă©tĂ© produit par le scripteur de la requĂȘte. Nous utilisons un test d’hypothĂšse Ă  cet effet. L’approche est testĂ©e sur deux bases d’écritures diffĂ©rentes et montre une grande robustesse aux diffĂ©rentes Ă©critures. L’approche semble donc trĂšs intĂ©ressante pour des applications Ă  plus grande Ă©chelle nĂ©cessitant d’interroger des bases de documents manuscrits
    corecore